從2022年,ChatGPT開始問世之後,全球都掀起了一股AI浪潮,也漸漸開始改變大家的工作與生活方式。經過這兩年的發展,除了大廠們AI應用之外,也越來越多人開始投入開發屬於自己或公司的AI應用程式,對開發者、產品經理甚至企業而言,GenAI 不只是新技術,而是一種能夠 提高效率、加速創新、甚至開啟新商業模式的關鍵力量。
這次鐵人賽,我也將挑戰讓自己透過Azure及GCP兩大平台來建構GenAI應用程式。
GenAI 是 Generative AI(生成式人工智慧) 的縮寫。
它是一類人工智慧技術,能夠根據輸入的提示(Prompt)自動產生新的內容,例如文字、圖片、音樂、程式碼,甚至是影片,其重點在於「生成」。
這邊的生成我們擺到工作或生活上來看,產出「一首詩」、「一張圖片」、「一篇文章」都是生成的範疇,再往軟體層面的工作來看,產生「執行任務用的指令」也都是生成的一種,所以雖然說是生成,但可以應用的範圍也非常的廣。
GenAI有以下幾個核心的特色:
簡單來說,GenAI可以做到的事情,從創意發想、圖文產生到日常重複工作等等的內容都可以提供非常大的幫助,而在背後支撐他的則是LLM。
LLM,全名是大型語言模型(Large Language Model),是人工智慧領域中一種先進的深度學習技術。LLM是基於 大規模文本資料訓練而成的神經網絡模型,能夠理解和生成人類自然語言。它們具有強大的文本理解和生成能力,可用於各種自然語言處理任務,如 問答、對話、文本生成、機器翻譯等。這種強大的語言能力使 LLM 成為當下 生成式人工智能的核心技術之一。
現在市面上也推出了很多語言模型可以使用,但是當需求越來越複雜有些特殊領域或是自己公司的內容沒有被訓練到模型當中,我們就得用以下幾種做法:
模型訓練 (Model Training)
模型訓練是指使用資料來調整模型參數,以使其能夠更好地完成特定任務。這是一個迭代過程,通過不斷地更新模型參數,使其在給定資料上的表現逐步改善。
微調 (Fine-tuning)
在預訓練模型的基礎上,使用特定領域的資料進行再訓練,以改善模型在該領域的表現。
檢索增強生成 (RAG)
在生成內容時,模型首先檢索相關的外部知識或資料,並利用這些檢索到的資訊來生成更準確和相關的回答或內容。
透過這些方式強化模型,可以讓我們的GenAI應用程式回答的更準確更實際。
要使用LLM進行GenAI應用程式的開發,我們必須得先部署模型後才能進行後續的動作,在企業 IT 架構裡,AI 可以部署在 地端(On-Premises) 或 雲端(Cloud)。兩者的差異如下:
面向 | 地端(On-Premises) | 雲端(Cloud) |
---|---|---|
硬體資源 | 需自行採購 GPU/TPU,成本高昂 | 隨租隨用,彈性伸縮 |
維運管理 | 需自行安裝、升級、維護 | 平台自動化,降低維運負擔 |
啟動速度 | 部署週期長,環境搭建繁瑣 | 幾分鐘就能建立模型服務 |
成本結構 | 前期投入大,固定資本支出 | 依用量計費,成本彈性 |
法規合規 | 敏感資料可完全掌握 | 須依賴平台的合規保障(GDPR、ISO 等) |
應用擴展 | 隨著需求增加,需要再添購設備 | 隨時可擴展運算與服務 |
從表格中可以看到,如果要訓練自己的模型,或是開發自己的GenAI應用程式,初期需要投入的成本會非常高,但許多人是個人研究開發,或是公司的資本沒有這麼雄厚卻又想要開發自己的GenAI應用程式,在這樣的趨勢下,兩大公有雲平台 —— Microsoft Azure 與 Google Cloud Platform (GCP),也推出了各自的生成式 AI 平台:
這兩個平台不僅提供最先進的大語言模型(LLM),更重要的是,能讓開發者將 AI 技術 快速應用在實務專案,包括:
客戶服務自動化(智慧客服、文件摘要)
對 GenAI 這類需要 龐大算力 + 快速迭代 的應用來說,雲端平台的彈性與完整工具鏈,讓開發者能更專注在應用本身,而不是硬體或環境維運。
要讓 GenAI 真正落地並應用在實際場景中,光靠「模型」是不夠的。還需要:
這也是為什麼像 Azure AI Foundry 與 GCP Vertex AI 這樣的平台,成為 GenAI 發展的核心載體。
今天我們從 GenAI的重要性與 地端 vs 雲端的差異 出發,說明為什麼雲端是 GenAI 的最佳選擇。
接下來的文章,我將從最基本的「平台登入與首次體驗」開始,開始逐步實戰。